BioNeMo模型扩展到基因组学!英伟达推出生成式AI药物设计和蛋白质预测项目
第二个即将推出的模型是scBERT,该模型基于单细胞RNA测序的数据进行训练,使用户能够将其应用于下游任务,如预测基因敲除的效果或识别细胞类型,如神经元、血细胞或肌肉细胞。
第三个模型EquiDock,该模型可以预测两种蛋白质如何相互作用的3D结构,这对于了解药物分子是否有效至关重要。
BioNeMo平台,来源:英伟达官网
BioNeMo是一个用于药物研发的生成式AI平台,可帮助用户更轻松、更快速地基于自己的数据来训练模型,以及扩展模型在药物研发应用领域的部署。BioNeMo提供了一种更加快捷的AI模型开发和部署方式,能够加速由AI助力的药物研发过程。目前,已有100多家生物制药和AI药物研发公司使用其BioNeMo平台,包括安进、安斯泰来制药、Cadence、Iambic、Insilico Medicine、Recursion和Terray Therapeutics。
其中,英伟达与软件开发商InstaDeep和慕尼黑工业大学合作,为AI模型提供基因数据,最终转化为蛋白质。利用数百人的DNA,以及英国最强大的超级计算机“剑桥一号”,研究人员发现,开发一种可应用于各种不同任务的通用程序(即基因组语言模型)是可行的,而不是要求科学家构建适合自己目的的AI来寻找每个生物学问题的答案。
与此同时,英伟达一直在与合成生物学公司Evozyne合作建立一个大型语言模型,专注于构建从未见过的蛋白质。基于英伟达的BioNeMo框架,研究人员可以使用该模型向多环芳烃的人类代谢蛋白添加数十种氨基酸突变,将其形状改变为更有效的形式。
BioNeMo框架,来源:英伟达官网
例如,通过添加167个突变,只留下一半的蛋白质原始序列,研究人员发现了一种可能将其功能提高15%的形状。Evozyne公司表示,另有包含51个突变的迭代显示出85%的序列相似性,但能够将功能提高2.5倍。
该研究是建立在研究蛋白质折叠的计算机模型之上,近期,相关模型也取得了重大突破。DeepMind的AlphaFold AI在2020年帮助解决了几十年前的生物学谜题,表明其可以从一系列氨基酸到单个原子范围内预测蛋白质的最终形状。2022年,DeepMind通过提供从动物、植物、细菌等中分类的近2亿种蛋白质的视觉模型,将其工作扩展到几乎涵盖了科学上已知的所有蛋白质。
英伟达和Evozyme认为,该合作项目可以为设计蛋白质奠定基础,这些蛋白质或有一天可以用于治疗先天性疾病。
热文推荐
点亮"在看”吧